搜索引擎算法之HITS算法
经常会遇到一些小伙伴问,大仙,为什么导航网站的首页能有这么高的权重啊?它明明没有什么真实内容啊,全部都是放一些人家第三方的网站在上面。
如果你了解HITS算法,那么这个问题就迎刃而解。
一、HITS算法的概念
“HITS算法是用户输入关键词后,算法会对返回的匹配页面计算两种值,一种是枢纽值(Hub Scores),另一种是权威值(Authority Scores),这两种值是互相依存、互相影响的。”——百度百科
这里要注意两点,枢纽值(Hub Scores)和权威值(Authority Scores),它们是构成HITS算法的两个基础定义,也是本文重点解释要解释的,我们简称为:Hub和Authority页面。
Hub页面:指的是包含了大量的高质量Authority页面链接的网页;
Authority页面:指的是与某个领域或者某个话题相关的高质量页面;
很抽象是么?直观来讲,网址导航的首页,是一个高质量的Hub页面。
而我们所用的百度首页,就是搜索引擎领域一个高质量的Authority页面。
两者关系是互相影响,互相增强的。
二、HITS算法和PR算法
我们之前有提到过搜索引擎的目标:更全、更快、更准;HITS算法则属于“更准”环节。
同属于“更准”环节的包括百度超链接算法和谷歌PR算法(这个比较重要,后面我会详细介绍),它们都是一种链接分析算法。
不同的是,HITS算法开始于用户查询,而PR算法是全局性的,与查询无关,在分析页面的时候就已经开始启用。
三、HITS算法对seo的应用
相信很多做百科的小伙伴,都会遇到一个问题,需要权威网站的相关参考页面,很多人都会因此去购买新闻源发软文。
那这个参考页面有啥用?
除了考虑到对该词条的信息补充,从本文的HITS算法角度考虑。
添加其他权威网站的相关参考页面,有利于帮助该词条的百科页面,成为一个Hub页面;与此同时,因为百科页面本身丰富的内容,它同属于一个高质量的Auhority页面。
这就是我们上面有提到的,两者互相影响,互相增强,并非独立关系。
所以我们学习到的优化知识点:
3.1、高质量参考页面的引用
在编辑文章的时候,特别是想写出高质量文章,不要吝啬你的链接,可以适当的引用其他高质量的相关页面,详细请参考百科页面。
注:需要说明这点,很多垃圾网页,就喜欢利用这一点作弊;因为上面有提到,一个页面大量给出链接到高质量的页面,它属于Hub页面。
而垃圾页面其实质内容可能是些黄赌毒,同时又输出链接到Auhority页面,这会提高页面自身的Hub分值,混淆蜘蛛的判断。
3.2、高质量的外链建设
排除那些使用工具或者Python日发百万外链,如果你无法做到这么多;请你相信,多做些高质量的外链,好过花时间去发垃圾链接。
高质量的外链平台包括:知乎、豆瓣、简书、行业论坛(博客)等等。
3.3、Auhority页面更重要
虽然HITS算法会分析页面的两个分值,然而对于搜索引擎来说,Auhority值更重要。
不难理解,毕竟Auhority页面是实实在在的内容输出。(采集站请略过)
3.4、不要随意使用nofollow标签
见过一些人总会问,网站的备案链接需不需要添加nofollow标签?
看完本文,相信你已经有了答案。
以上,如有错误,欢迎指出。
▽